数学的知識 自然言語処理のための機械学習
自然言語処理のための機械学習
数学的知識
最適化
凸集合と凸関数
なんとなくわかる(危険)ので飛ばす
凸計画問題
数値解析: gradient method
ニュートン法
: ヘッセ行列を使うが,,,
等式制約凸計画問題
"変分法"
ラグランジュ関数、未定乗数法
不等式制約凸計画問題
確率
期待値
、平均、分散
結合確率と条件付き確率
独立性
代表的な離散確率分布
連続確率変数
平均、分散
連続確率分布の例
パラメータ推定法
i.i.d
と
尤度
最尤推定
最大事後確率推定
情報理論
エントロピー
カルバックライブラーダイバージェンス (
KLダイバージェンス
)
ジェンセン・シャノン・ダイバージェンス
自己相互
情報量
相互情報量
まとめ
章末問題